بررسی و امکان سنجی بهبود سیستم های جستجوی اطلاعات فارسی-انگلیسی

پایان نامه
چکیده

همراه با افزایش تصاعدی حجم اطلاعات در چند دهه ی اخیر، بحث یافتن اطلاعات مورد نیاز کاربران به یکی از مهم ترین چالش ها در سیستم های اطلاعاتی تبدیل شده است. در این راستا، سیستم های جستجوی اطلاعات به عنوان ابزاری برای رفع نیاز اطلاعاتی کاربران به کار گرفته شده اند. از مهم ترین مشکلات در سیستم های جستجوی اطلاعات، عدم توجه به زبان اسناد است. این موضوع جستجوی کاربران را عملاً به زبانی محدود می کند که کاربر به آن زبان نیاز اطلاعاتی خود را مطرح می کند. برای حل این مشکل، بحث سیستم های جستجوی اطلاعات بین زبانی مطرح شده است. در یک سیستم جستجوی اطلاعات بین زبانی، عملیات جستجوی اسناد به زبان پرس وجوی کاربر محدود نیست. از عمده ترین مشکلات در چنین سیستمی، انجام یک ترجمه ی صحیح و بدون ابهام، از زبان کاربر به زبان اسناد است. در این تحقیق اثر ترکیب ابزار های پردازش زبان طبیعی در بهبود عملیات رفع ابهام ترجمه در سیستم جستجوی اطلاعات فارسی- انگلیسی، بررسی شده است. روش پیشنهاد شده به این شکل است که ابتدا یک گراف ترجمه به کمک کاندیدا های ترجمه ی پرس وجوی کاربر ایجاد می شود. سپس از ترکیب ابزار های پردازش زبان طبیعی، یک شبکه ی معنایی ایجاد می شود تا کاندیداهای ترجمه ی موجود در گره های گراف ترجمه، به گره های این شبکه ی معنایی نگاشت شود. وزن هر یال در گراف ترجمه به کمک تعیین کوتاه ترین مسیر بین گره های معادل آن یال در شبکه ی معنایی، تعیین می شود. برای یافتن کوتاه ترین مسیر بین گره ها در شبکه ی معنایی، از روش پیمایش سطحی دوطرفه استفاده شده است تا زمان اجرای الگوریتم جستجو کاهش یابد. در اولین آزمایش انجام شده، پایگاه داده ی لغوی وُردنت به عنوان آنتولوژی درنظر گرفته شد تا اثر پیمایش روابط موجود در آنتولوژی، بر رفع ابهام ترجمه ارزیابی شود. سپس شبکه ی معنایی یاد شده به کمک ترکیب وُردنت و فریم نت که پایگاه داده ی دیگری بر اساس معنا شناسی قاب است، ایجاد شد تا مسیر یافته شده به کمک آن بهبود یابد. نتایج بدست آمده نشان می دهد انتخاب کم وزن ترین زیر گراف کامل در گراف ترجمه می تواند در بهبود عملیات رفع ابهام ترجمه موثّر باشد.

منابع مشابه

بهبود و توسعه یک سیستم مترجم‌یار انگلیسی به فارسی

In recent years, significant improvements have been achieved in statistical machine translation (SMT), but still even the best machine translation technology is far from replacing or even competing with human translators. Another way to increase the productivity of the translation process is computer-assisted translation (CAT) system. In a CAT system, the human translator begins to type the tra...

متن کامل

بهبود و توسعه یک سیستم مترجم یار انگلیسی به فارسی

در این مقاله، ما برای اولین بار به بررسی سیستم های مترجم یار تعاملی و ارائه روش هایی در جهت بهبود کارایی این سیستم ها در زمینه ی ترجمه ی انگلیسی به فارسی می پردازیم. در یک سیستم مترجم یار تعاملی، یک ترجمه از یک سری همکاری های متناوب ماشین و مترجم انسانی به وجود می آید. مشارکت ماشین تنها در قالب پیشنهاداتی درباره جمله مقصد انجام می شود، اما مترجم می تواند آزادانه پیشنهادات ارائه شده توسط مشارکت ...

متن کامل

کاربرد سیستم اطلاعات جغرافیایی در امکان سنجی توان های محیطی و تعیین الگوی فضایی بهینه در نواحی روستایی

در این تحقیق که با هدف تعیین مراکز روستایی یا روستا شهرها در محدوده شهرستان تربت حیدریه انجام شده است، با استفاده از سیستم اطلاعات جغرافیایی(GIS)، اطلاعات فضایی و غیر فضایی مختلف که در تعیین مکان بهینه نقش دارند، مورد تجزیه و تحلیل قرار گرفته است. این شهرستان در زمان انجام تحقیق حدود 70 درصد جمعیت روستایی داشته و تنوع جغرافیایی و اقلیمی آن باعث تنوع در معیشت روستایی در سطح ناحیه شده ...

متن کامل

امکان سنجی کشت پنبه در جویملارستانبا استفاده از سیستم اطلاعات جغرافیایی GIS

انسان‌ها از گذشته های بسیار دور به این واقعیت مهم دست یافتند که برای گذران زندگی و گام نهادن به سوی ترقی به ایستی به عناصر تجارت، زراعت و صنعت توجه داشت. در قرون بعد ÷این باور ضرورت یافت که از میان سه عنصر یاد شده، کشاورزی و تولید مواد غذایی در اولویت قرار دارد. در این میان گیاه پنبه به عنوان یک محصول اساسی و استراتژیک از دیر باز مورد توجه بشر بوده است. این تحقیق به امکان سنجی کشت این محصول در ...

متن کامل

امکان سنجی کشت کلزا در شهرستان ایذه با استفاده از سیستم اطلاعات جغرافیایی (GIS)

شناخت و تعیین نواحی مستعد اکولوژیکی برای بسترسازی مناسب در برنامه ریزی منطقه­ای و بویژه بخش کشاورزی امری حیاتی و مهم است. متکی بودن اقتصاد مردم نواحی روستایی بر کشاورزی، قابلیت کشاورزی منطقۀ مورد مطالعه، اقلیم مناسب و چند فصلی، خاک مطلوب، تنوع محیطی و تعیین و تفکیک پتانسیل­ها و تنگناهای منطقه از لحاظ درصد تولید و بازدهی کشت کلزا، ضرورت تحقیق را بازگو می کند. هدف از انجام پژوهش این بوده که توان ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023